花費 21 ms
【librosa】音頻特征提取

參考 【librosa】及其在音頻處理中的應用 librosa官方文檔 liborosa源碼 Overview: module code log-spectr ...

Tue Jan 05 01:43:00 CST 2021 0 1289
說話人日志/分類/分割/跟蹤(Speaker Diarisation)

簡稱SD,顧名思義,在采集的語音信號流中,分辨出不同說話人的說話時長並標注,即以時間為索引,檢測出每段語音所對應的說話人身份,其通常由說話人分割和聚類兩步組成。 參照2010年8月的文獻[1]中的一 ...

Sun Jan 05 02:45:00 CST 2020 0 2751
聲紋識別(說話人識別)技術

說話人識別(Speaker Recognition,SR),又稱聲紋識別(Voiceprint Recognition,VPR),顧名思義,即通過聲音來識別出來“誰在說話”。語音識別(Automati ...

Thu Jul 26 08:04:00 CST 2018 0 2503
梅爾倒譜系數特征(Mel-frequency cepstral coefficients,MFCC)

引言 感知實驗表明,人耳對於聲音信號的感知聚焦於某一特定頻率區域內,而非在整個頻譜包絡中。耳蝸的濾波作用是在對數頻率尺度進行的,在1000Hz以下為線性,在1000Hz以上為對數,這就使得人耳對低頻 ...

Wed Apr 17 00:24:00 CST 2019 0 1442
使用ML.NET實現猜動畫片台詞

前面幾篇主要內容出自微軟官方,經我特意修改的案例的文章: 使用ML.NET實現情感分析[新手篇] 使用ML.NET預測紐約出租車費 .NET Core玩轉機器學習 使用ML.NET實現情感分析 ...

Fri May 18 03:22:00 CST 2018 7 1782
【sklearn】Gaussian Mixture Model

概述 參考 sklearn.mixture: Gaussian Mixture Models 高斯混合模型(GMM)源代碼實現(二) A Gaussian Mix ...

Wed Feb 03 02:08:00 CST 2021 0 594
【album】語音合成技術

持續更新中。 基礎 語音合成(Text To Speech,TTS),將文字轉化為語音的一種技術。 語音合成技術 - 知乎 (zhihu.com) 論文推介:Glow-WaveGAN—學習 ...

Sat Aug 07 00:55:00 CST 2021 0 176

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM